查看原文
其他

现代 IM 系统中消息推送和存储架构的实现

点击上方 "程序员小乐" ,关注公众号

8点20分,第一时间与你相约

每日英文 

Dream what you want to dream;go where you want to go;be what you want to be,because you have only one life and one chance to do all the things you want to do. 

做你想做的梦吧,去你想去的地方吧,成为你想成为的人吧,因为你只有一次生命,一个机会去做所有那些你想做的事。

小乐有话说 

如果想让生活更加美好,也让自己更加美好地生活,我们不妨就把生活看作是一滴灵动的水。就像它一样,一切随势顺缘,尽情欢畅奔流。


来自:木洛,链接:https://zhuanlan.zhihu.com/p/31143916

责编:乐乐 | 封面来自网络


00 前言 


IM 全称是“Instant Messaging”,中文名是即时通讯。在这个高度信息化的移动互联网时代,生活中 IM 类产品已经成为必备品,比较有名的如钉钉、微信、QQ 等以 IM 为核心功能的产品。当然目前微信已经成长为一个生态型产品,但其核心功能还是 IM。还有一些非以 IM 系统为核心的应用,最典型的如一些在线游戏、社交应用,IM 也是其重要的功能模块。可以说,带有社交属性的应用,IM 功能一定是必不可少的。


IM 系统在互联网初期即存在,其基础技术架构在这十几年的发展中更新迭代多次,从早期的 CS、P2P 架构,到现在后台已经演变为一个复杂的分布式系统,涉及移动端、网络、安全和存储等技术的方方面面。其支撑的规模也从早期的少量日活,到现在微信这个巨头最新公布的达到 9 亿日活的体量。


IM 系统中最核心的部分是消息系统,消息系统中最核心的功能是消息的同步和存储:


  • 消息的同步:将消息完整、快速地从发送方传递到接收方,就是消息的同步。消息同步系统最重要的衡量指标就是消息传递的实时性、完整性以及能支撑的消息规模。从功能上来说,一般至少要支持在线和离线推送,高级的 IM 系统还支持“多端同步”。


  • 消息的存储:消息存储即消息的持久化保存,这里不是指消息在客户端本地的保存,而是指云端的保存,功能上对应的就是“消息漫游”。“消息漫游”的好处是可以实现账号在任意端登陆查看所有历史消息,这也是高级 IM 系统特有的功能之一。


本文内容主要涉及 IM 系统中的消息系统架构,会介绍一种基于 TableStore 构建的消息同步以及存储系统的架构实现,能够支持消息系统中的高级特性“多端同步”以及“消息漫游”。在性能和规模上,能够做到全量消息云端存储,百万 TPS 以及毫秒级延迟的消息同步能力。


01 架构设计 


本章主要会介绍基于 TableStore 的现代 IM 消息系统的架构设计,在详细介绍架构设计之前,会先介绍一种 Timeline 逻辑模型,来抽象和简化对 IM 消息同步和存储模型的理解。理解了 Timeline 模型后,会介绍如何基于此模型对消息的同步以及存储进行建模。基于 Timeline 模型,在实现消息同步和存储时还会有各方面的技术权衡,例如如何对消息同步常见的读扩散和写扩散两种模型进行对比和选择,以及针对 Timeline 模型的特征如何来选择底层数据库。

传统架构 vs 现代架构


上图是消息系统传统架构与现代架构的简单对比。


传统架构下,消息是先同步后存储。对于在线的用户,消息会直接实时同步到在线的接收方,消息同步成功后,并不会进行持久化。而对于离线的用户或者消息无法实时同步成功时,消息会持久化到离线库,当接收方重新连接后,会从离线库拉取所有未读消息。当离线库中的消息成功同步到接收方后,消息会从离线库中删除。传统的消息系统,服务端的主要工作是维护发送方和接收方的连接状态,并提供在线消息同步和离线消息缓存的能力,保证消息一定能够从发送方传递到接收方。服务端不会对消息进行持久化,所以也无法支持消息漫游。


现代架构下,消息是先存储后同步。先存储后同步的好处是,如果接收方确认接收到了消息,那这条消息一定是已经在云端保存了。并且消息会有两个库来保存,一个是消息存储库,用于全量保存所有会话的消息,主要用于支持消息漫游。另一个是消息同步库,主要用于接收方的多端同步。消息从发送方发出后,经过服务端转发,服务端会先将消息保存到消息存储库,后保存到消息同步库。完成消息的持久化保存后,对于在线的接收方,会直接选择在线推送。但在线推送并不是一个必须路径,只是一个更优的消息传递路径。对于在线推送失败或者离线的接收方,会有另外一个统一的消息同步方式。接收方会主动的向服务端拉取所有未同步消息,但接收方何时来同步以及会在哪些端来同步消息对服务端来说是未知的,所以要求服务端必须保存所有需要同步到接收方的消息,这是消息同步库的主要作用。对于新的同步设备,会有消息漫游的需求,这是消息存储库的主要作用,在消息存储库中,可以拉取任意会话的全量历史消息。


以上是传统架构和现代架构的一个简单的对比,现代架构上整个消息的同步和存储流程,并没有变复杂太多,但是其能实现多端同步以及消息漫游。现代架构中最核心的就是两个消息库“消息同步库”和“消息存储库”,是消息同步和存储最核心的基础。而本文接下来的部分,都是围绕这两个库的设计和实现来展开。


Timeline 模型


在分析“消息同步库”和“消息存储库”的设计和实现之前,在本章会先介绍一个逻辑模型——Timeline。Timeline 模型会帮助我们简化对消息同步和存储模型的理解,而消息库的设计和实现也是围绕 Timeline 的特性和需求来展开。



如图是 Timeline 模型的一个抽象表述,Timeline 可以简单理解为是一个消息队列,但这个消息队列有如下特性:


  • 每个消息拥有一个顺序 ID(SeqId),在队列后面的消息的 SeqId 一定比前面的消息的 SeqId 大,也就是保证 SeqId 一定是增长的,但是不要求严格递增。

  • 新的消息永远在尾部添加,保证新的消息的 SeqId 永远比已经存在队列中的消息都大。

  • 可根据 SeqId 随机定位到具体的某条消息进行读取,也可以任意读取某个给定范围内的所有消息。


有了这些特性后,消息的同步可以拿 Timeline 来很简单的实现。图中的例子中,消息发送方是 A,消息接收方是 B,同时 B 存在多个接收端,分别是 B1、B2 和 B3。A 向 B 发送消息,消息需要同步到 B 的多个端,待同步的消息通过一个 Timeline 来进行交换。A 向 B 发送的所有消息,都会保存在这个 Timeline 中,B 的每个接收端都是独立的从这个 Timeline 中拉取消息。每个接收端同步完毕后,都会在本地记录下最新同步到的消息的 SeqId,即最新的一个位点,作为下次消息同步的起始位点。服务端不会保存各个端的同步状态,各个端均可以在任意时间从任意点开始拉取消息。


消息漫游也是基于 Timeline,和消息同步唯一的区别是,消息漫游要求服务端能够对 Timeline 内的所有数据进行持久化。


基于 Timeline,从逻辑模型上能够很简单的理解在服务端如何去实现消息同步和存储,并支持多端同步和消息漫游这些高级功能。落地到实现的难点主要在如何将逻辑模型映射到物理模型,Timeline 的实现对数据库会有哪些要求?我们应该选择何种数据库去实现?这些是接下来会讨论到的问题。


消息存储模型



如图是基于Timeline的消息存储模型,消息存储要求每个会话都对应一个独立的 Timeline。如图例子所示,A 与 B/C/D/E/F 均发生了会话,每个会话对应一个独立的 Timeline,每个 Timeline 内存有这个会话中的所有消息,服务端会对每个 Timeline 进行持久化。服务端能够对所有会话 Timeline 中的全量消息进行持久化,也就拥有了消息漫游的能力。


消息同步模型


消息同步模型会比消息存储模型稍复杂一些,消息的同步一般有读扩散和写扩散两种不同的方式,分别对应不同的 Timeline 物理模型。



如图是读扩散和写扩散两种不同同步模式下对应的不同的 Timeline 模型,按图中的示例,A 作为消息接收者,其与 B/C/D/E/F 发生了会话,每个会话中的新的消息都需要同步到 A 的某个端,看下读扩散和写扩散两种模式下消息如何做同步。


  • 读扩散:消息存储模型中,每个会话的 Timeline 中保存了这个会话的全量消息。读扩散的消息同步模式下,每个会话中产生的新的消息,只需要写一次到其用于存储的 Timeline 中,接收端从这个 Timeline 中拉取新的消息。优点是消息只需要写一次,相比写扩散的模式,能够大大降低消息写入次数,特别是在群消息这种场景下。但其缺点也比较明显,接收端去同步消息的逻辑会相对复杂和低效。接收端需要对每个会话都拉取一次才能获取全部消息,读被大大的放大,并且会产生很多无效的读,因为并不是每个会话都会有新消息产生。


  • 写扩散:写扩散的消息同步模式,需要有一个额外的 Timeline 来专门用于消息同步,通常是每个接收端都会拥有一个独立的同步 Timeline,用于存放需要向这个接收端同步的所有消息。每个会话中的消息,会产生多次写,除了写入用于消息存储的会话 Timeline,还需要写入需要同步到的接收端的同步 Timeline。在个人与个人的会话中,消息会被额外写两次,除了写入这个会话的存储 Timeline,还需要写入参与这个会话的两个接收者的同步 Timeline。而在群这个场景下,写入会被更加的放大,如果这个群拥有 N 个参与者,那每条消息都需要额外的写 N 次。写扩散同步模式的优点是,在接收端消息同步逻辑会非常简单,只需要从其同步 Timeline 中读取一次即可,大大降低了消息同步所需的读的压力。其缺点就是消息写入会被放大,特别是针对群这种场景。


在 IM 这种应用场景下,通常会选择写扩散这种消息同步模式。IM 场景下,一条消息只会产生一次,但是会被读取多次,是典型的读多写少的场景,消息的读写比例大概是 10:1。若使用读扩散同步模式,整个系统的读写比例会被放大到 100:1。一个优化的好的系统,必须从设计上去平衡这种读写压力,避免读或写任意一维触碰到天花板。所以 IM 系统这类场景下,通常会应用写扩散这种同步模式,来平衡读和写,将 100:1 的读写比例平衡到 30:30。当然写扩散这种同步模式,还需要处理一些极端场景,例如万人大群。针对这种极端写扩散的场景,会退化到使用读扩散。一个简单的 IM 系统,通常会在产品层面限制这种大群的存在,而对于一个高级的 IM 系统,会采用读写扩散混合的同步模式,来满足这类产品的需求。


消息库设计


基于 Timeline 模型,以及 Timeline 模型在消息存储和消息同步的应用,我们看下消息同步库和消息存储库的设计。



如图是基于 Timeline 的消息库设计。


  • 消息同步库:消息同步库用于存储所有用于消息同步的 Timeline,每个 Timeline 对应一个接收端,主要用作写扩散模式的消息同步。这个库不需要永久保留所有需要同步的消息,因为消息在同步到所有端后其生命周期就可以结束,就可以被回收。但是如前面所介绍的,一个实现简单的多端同步消息系统,在服务端不会保存有所有端的同步状态,而是依赖端自己主动来做同步。所以服务端不知道消息何时可以回收,通常的做法是为这个库里的消息设定一个固定的生命周期,例如一周或者一个月,生命周期结束可被淘汰。


  • 消息存储库:消息存储库用于存储所有会话的 Timeline,每个 Timeline 包含了一个会话中的所有消息。这个库主要用于消息漫游时拉取某个会话的所有历史消息,也用于读扩散模式的消息同步。


消息同步库和消息存储库,对数据库有不同的要求,如何对数据库做选型,在下面会讨论。


数据库选型


消息系统最核心的两个库是消息同步库和消息存储库,两个库对数据库有不同的要求:



总结下来,对数据库的要求有如下几点:


1. 表结构设计能够满足 Timeline 模型的功能要求:不要求关系模型,能够实现队列模型,并能够支持生成自增的 SeqId。


2. 能够支持高并发写和范围读,规模在十万级 TPS。


3. 能够保存海量数据,百 TB 级。


4. 能够为数据定义生命周期。


阿里云表格存储(TableStore)是基于 LSM 存储引擎的分布式 NoSQL 数据库,支持百万 TPS 高并发读写,PB 级数据存储,数据支持 TTL,能够很好的满足以上需求,并且支持自增列,能够非常完美的设计和实现 Timeline 的物理模型。


02 架构实现 


本章会以一段非常精简的代码,来展示如何基于 TableStore 实现 Timeline 模型,并基于 Timeline 模型进行消息存储和推送。本文中给出的代码,主要目的是为了演示如何能够实现一个精简 Timeline 的最基本功能。马上我们会推出一个完整的 Timeline Library,来将基于 Timeline 进行消息存储和推送的代码的开发变得无比简单。


所有示例代码基于如下 SDK 版本:



表结构设计




以上是创建 Timeline 表的示例代码,总共需要创建两张表,一张表作为消息同步库,名称为“PushTable”,另一张表作为消息存储库,名称为“StoreTable”。

推送和存储实现



以上是模拟一个群内消息同步和存储的示例代码。群名称为『TableStore(钉钉号:11789671)』,群内成员有『A, B, C, D, E』。群内新的消息,需要先存储到群的存储 Timeline(Timeline ID 为群名称),之后需要以写扩散的模式推送到群内每个成员的同步 Timeline(以群成员名称作为 Timeline ID)。



以上是拉取群内历史消息以及某个群成员进行消息同步的示例代码,主要逻辑在 syncMessages 函数内。示例代码中,拉取消息都是从 seq_id 为 0 开始,0 为 TableStore 自增列中最小值,所以代表了从最小的一个位点开始拉取消息,即拉取全量消息。


03 后记 


这篇文章主要介绍了现代IM系统中消息推送和存储架构的实现,基于逻辑的 Timeline 模型,我们可以很清晰明了的理解整个消息推送和存储的架构。基于 TableStore,可以非常简单的实现 Timeline 模型,其中自增列功能,完美的匹配了 Timeline 模型中所需要的最关键的 SeqId 自增。


TableStore(表格存储)是阿里云自主研发的专业级分布式 NoSQL 数据库,是基于共享存储的高性能、低成本、易扩展、全托管的半结构化数据存储平台,支撑互联网和物联网数据的高效计算与分析。IM 系统的消息推送和存储场景,是 TableStore 在社交领域的重要应用之一。


基于 Timeline 的消息存储和推送模型,将不光应用在 IM 消息系统中,还可应用在例如 Feeds 流、实时消息同步、直播弹幕等场景。


荐阅读

阿里、腾讯、百度、华为、京东最新面试题汇集

让我们聊一聊计算机基础知识的最小集合

Java中的多线程你只要看这一篇就够了

看了都说好:浅谈前后端分工协作

这里有你需要的编程技术、心得、经验(数据结构与算法、源码分析等),这里不止限于技术!还有职场心得、生活感悟、以及面经等。关注公众号,第一时间送达!


看完本文有收获?请转发分享给更多人
关注「程序员小乐」,收看更多精彩内容

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存